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摘要 : [目的 /意义 ] 通 过 对 移动 图 书馆 用 户 生 成 内 容 的 情感 分 析 , 预 测 用 户 情感 倾向 对 移动 图 书馆 资源 的 


评价 效果 ,从 而 更 好 地 实现 移动 图 书馆 资源 推广 和 精准 推荐 服务 。 


[方法 /过 程 ] 基 于 情感 分 析 提 出 移动 图 书馆 


用 户 生成 内 容 评价 效果 分 析 过 程 ,以 获取 的 “ 掌 阅 图 书馆 ”中 15 部 年 度 畅销 书籍 的 用 户 生成 内 容 为 研究 样本 ， 
对 数据 进行 预 处 理 ,在 此 基础 上 从 领域 词典 构建 .情感 分 类 、 评 价 效果 3 个 过 程 入 手 进行 分 析 。|[ 结果 /结论 ] 数 
据 分 析 结果 表明 ,移动 图 书馆 UGC 用 户 情感 倾向 具有 多 元 性 和 一 致 性 ,中 性 评价 具有 重要 性 ,能 够 较为 准确 地 
预测 移动 图 书馆 资源 的 得 分 情况 。 将 情感 分 析 相 关 理 论 和 方法 引入 移动 图 书馆 UGC 研究 ,能 够 为 移动 图 书馆 


完善 其 服务 措施 、 提 高 其 服务 质量 提供 参考 意见 。 


T 关键 词 : 情感 分 析 移动 图 书馆 ”用户 生成 内 容 


Iw 43:59: G250 
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评价 效果 


移动 图 书馆 服务 借助 智能 手机 等 各 种 移动 终端 使 
用 六 的 阅读 行为 边界 逐渐 模糊 ,阅读 行为 不 再 只 是 简 
单 贰 获取 书本 内 容 的 过 程 ,而 是 逐渐 演变 成 一 种 集 阅 
读 s 创 作 、 分 享 和 社交 等 行为 于 一 体 的 社 群 化 行为 。 在 
这 种 移动 图 书馆 社 群 化 服务 模式 下 ,用 户 不 再 只 是 内 
容 的 阅读 者 ,也 逐渐 成 为 内 容 的 生产 者 和 传播 者 "… ,用 
PERIN X ( user -generated content , UGC ) 成 为 移动 图 
TRO SEC IL EVEUR oer UGC 的 管理 和 利用 也 成 为 移 
动 图 书馆 满足 用 户 需 求 建 立 用 户 忠 诚 度 的 重要 方式 
之 一 。 内 容 丰 富 并 且 具 有 需求 针对 性 的 移动 图 书馆 
UGC ,体现 了 移动 阅读 用 户 的 集体 智慧 ” ,针对 移动 图 
书馆 社 群 化 服务 中 的 UGC 进行 文本 挖掘 和 情感 分 析 ， 
以 发 现 用 户 对 移动 图 书馆 资源 的 评价 与 情感 倾向 ,从 
而 更 好 地 实现 移动 图 书馆 资源 推广 和 精准 推荐 服务 成 
为 当前 新 的 研究 热点 。 
国内 外 已 有 学 者 展开 了 相关 方面 UGC 挖掘 和 情 
感 分 析 的 研究 。L，Siguenza-Guzman 等 学 者 通过 文献 
综述 的 形式 ,对 文本 挖掘 在 图 书馆 领域 的 应 用 进行 了 


全 面 综合 的 梳理 和 分 析 , 指 出 这 一 方法 对 于 确定 图 书 
馆 工作 存在 的 问题 以 及 预测 未 来 用 户 需 求 具有 重要 作 
H^ ;Q. Zhou 等 的 研究 指出 ,通过 识别 情感 极 性 和 情 
感 价值 ,丰富 的 在 线 学 术 书 籍 评论 资 源 可 以 被 用 来 进 
行 更 深层 次 的 信息 和 内 容 挖掘 ”; 祝 振 媛 将 网 络 书 评 
视 为 一 种 商品 评价 文本 ,利用 基于 信息 分 类 的 内 容 挖 
据 方 法 分 析 书 评 文本 的 语言 特点 、 语 言 模式 和 内 容 构 
成 ; 侯 银 秀 等 利用 情感 分 析 方法 在 对 用 户 图 书评 论 
进行 属性 层 文 本 挖掘 的 基础 上 获取 用 户 图 书 属性 俩 
好 ,从 而 实现 优化 图 书 个 性 化 推荐 的 效果 “ 。 从 以 上 
学 者 的 研究 中 可 以 看 出 , 列 含 丰富 用 户 观点 和 情感 的 
UGC 具有 巨大 的 分 析 价值 ” ,通过 对 UGC 的 情感 分 析 
和 内 容 挖 据 , 不 仅 可 以 掌握 用 户 的 情感 倾向 与 价值 偶 
好 ,还 可 以 根据 分 析 结 果 对 用 户 的 个 性 化 需求 进行 精 
准 化 推荐 服务 ,达到 完善 服务 模式 的 目的 。 但 是 目前 
基于 情感 分 析 的 移动 图 书馆 UGC 评价 效果 方面 的 研 
究 相 对 较 少 。 

本 研究 将 基于 情感 分 析 , 构 建 移 动 图 书馆 UGC 情 
感 词典 ,在 对 所 采集 到 的 UGC 进行 情感 分 类 的 基础 


* 本 文系 国家 自然 科学 面 上 项 目 " 信 息 生 态 视 角 下 新 媒体 信息 消费 行为 机 理 及 服务 模式 创新 研究 ”( 项目 编号 :71673108 ) 和 吉林 大 学 高 峰 学 


科 ( 群 ) 建 设 项 目 研究 成 果 之 一 。 
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上 ,运用 BP 神经 网 络 方法 对 移动 图 书馆 UGC 的 评价 
效果 进行 分 析 。 本 研究 试图 解决 以 下 3 个 研究 问题 : 
中 如 何 有 效 构建 移动 图 书馆 UGC 的 情感 词典 ? Qn 
何 对 移动 图 书馆 UGC 进行 有 效 的 情感 分 类 ? 四 如 何 
在 情感 分 类 的 基础 上 分 析 移 动 图 书馆 UGC 评价 效果 ? 
本 文 在 理论 方面 ,将 情感 分 析 的 相关 理论 引入 移 动 图 
书馆 UGC 情感 分 类 研究 ,拓展 了 情感 分 析 理 论 的 适用 
范围 ;在 实践 方面 ,深入 挖 气 和 分 析 了 用 户 生成 内 容 中 
所 包含 的 对 移动 图 书馆 服务 资源 的 评价 内 容 和 情感 倾 
向 ,能 够 为 移动 图 书馆 完善 其 服务 措施 、 提 高 其 服务 质 
提供 一 定 的 参考 。 


2 ”相关 概念 


24e 用 户 生成 内 容 

一 忆 界 经 合 组 织 (OECD) 在 2007 年 的 报告 中 将 用 户 
生成 内 容 (UGC) 定 义 为 由 非 专业 人 员 创 作 的 具有 一 定 
创 萄 性 的 互联 网 公开 可 用 内 容 ”。UGC 在 表现 形式 
上 泥 指 以 多 元 化 的 形式 在 互联 网 上 公开 发 表 的 由 用 户 
创作 的 文字 图片 音频、 视频 等 内 容 ”。UCC 是 在 个 


二 


分 析 方 法 。 基 于 词典 的 分 析 方 法 本 质 上 是 将 情感 分 析 
任务 视 为 情感 词典 与 待 处 理 语 料 之 间 的 匹配 问题 "1。 
基于 词典 的 分 析 方 法 需要 预先 定义 情感 词典 来 确定 语 
料 的 情感 极 性 ,因此 情感 极 性 识别 的 效果 很 大 程度 上 
取决 于 情感 词典 的 质量 。 基 于 情感 词典 对 语 料 情感 倾 
向 进行 识别 和 判断 的 方法 具有 通用 性 强 的 优点 ,能够 
简单 迅速 地 识别 并 判断 语 料 中 情感 词 的 情感 倾向 性 。 
但 是 该 方法 对 情感 词典 有 较 强 的 依赖 性 ,需要 领域 性 、 
针对 性 较 强 和 覆盖 性 较 广 的 情感 词典 作为 基础 。 
2.3 ”移动 图 书馆 UGC 情感 分 析 

Web 2.0 应 用 的 介入 使 得 UGC 以 及 其 为 用 户 带 3 
的 潜在 利益 被 扩 展 到 了 图 书馆 领域 1。 C. Dezelar- 
tiedman 的 研究 探讨 了 英国 文学 作品 中 用 户 提 供 的 标 
签 是 否 可 以 增强 或 补充 学 术 图 书馆 目录 中 对 同一 作品 
的 主题 标 引 7 Y. Naik AB. Trot 的 研究 探讨 了 用 户 
如 何在 图 书馆 在 线 读者 社 群 中 通过 讨论 和 评价 书籍 的 
方式 协助 其 他 用 户 发 现 “ 好 书 ””;L，F.，Spiteri 认为 
目前 图 书馆 的 发 现 系统 具有 Web 2.0 的 社交 功能 ,能 
够 允许 用 户 通 过 添加 自己 的 标签 .评级 和 评论 来 增强 


GH 效 信息 共享 条 件 下 从 集聚 内 容 贡 献 中 所 生成 的 集 
体 利益 ,其 核心 优点 在 于 能 够 利用 个 人 知识 和 信息 的 
高 岗 经 验 性 ,使 得 这 种 浓缩 性 的 个 人 经 验 为 更 多 人 所 
ER. UGC 既是 用 户 产生 的 静态 网 络 信息 资源 ,也 
是 计 户 生成 创作 的 动态 行为 模式 ,还 可 以 理解 为 与 用 
启 孚 和 社交 网 络 密切 相关 的 一 种 秩序 。 

之 虽然 国内 外 学 者 对 UGC 的 定义 存在 一 些 差异 ,但 
是 可 以 看 出 UGC 非 权威 化 .体现 集体 智慧 与 协同 创作 
的 辕 点 得 到 了 普遍 认可 。Web 2.0 的 开放 与 参与 模式 
使 得 互联 网 更 加 依赖 用 户 参 与 和 用 户 建 设 "" ,并 且 
UGC 对 用 户 认 知 信任 的 影响 比 专业 生成 内 容 具 有 更 
强 的 效果 5 ,因此 UGC 成 为 重要 的 网 络 信息 资源 创作 
与 组 织 模式 。 

2.2 情感 分 析 的 定义 及 方法 

情感 分 析 自 20 世纪 90 年 代 后 期 开始 进入 研究 领 
域 ,并 迅速 成 为 一 个 活跃 的 研究 课题 。 情 感 分 析 是 一 
种 利用 自然 语言 处 理 方法 和 文本 分 析 方法 从 原始 语 料 
中 探索 主观 信息 的 研究 方法 ,从 出 现 以 来 就 得 到 了 广 


书目 记录 的 内 容 "” ,通过 对 作品 主题 .人物 和 对 读者 
影响 的 洞悉 ,图 书馆 UGC 为 用 户 提供 了 一 个 丰富 的 数 
据 集 , 它 能 够 清晰 地 与 已 知 的 读者 咨询 访问 点 连 
Bt ;Y. J. Moon 等 在 研究 中 指出 用 户 生 成 的 社会 化 
书签 能 够 作为 信息 获取 过 程 中 的 有 效 智能 搜索 引 
擎 ;还 有 一 些 研究 者 探索 了 丰富 的 用 户 生 成 内 容 ， 
从 而 作为 支持 个 性 化 推荐 补充 来 源 '” 。 

移动 图 书馆 服务 依托 移动 网 络 和 数字 图 书馆 技 
AR ,不 仅 使 用 户 不 受 时 间 和 空间 限制 ,通过 各 种 移动 设 
备 获 取 图 书馆 信息 资源 成 为 可 能 ,而 且 通 过 服务 的 不 
断 创 新 ,构建 起 以 用 户 为 中 心 鼓励 用 户 参 与 的 社 群 化 
服务 模式 。 在 “用 户 -用户 “用 户 - 馆 员 ”“ 用 户 - 馆 
藏 ”等 社 群 化 行为 中 产生 的 UGC 成 为 移动 图 书馆 知识 
生态 系统 的 重要 内 容 ”。 移 动 图 书馆 UGC 是 移动 图 
书馆 用 户 在 社 群 化 服务 模式 下 所 产生 的 公开 可 用 内 
容 , 体 现 了 用 户 集体 智慧 和 个 性 化 创造 能 力 ,具有 更 强 
的 自然 语言 逻辑 性 和 思想 性 ,针对 其 评价 效果 做 出 深 
入 挖掘 和 分 析 , 可 以 有 效 掌握 移动 图 书馆 用 户 对 图 书 


泛 的 发 展 ,并 在 数据 挖掘 、 信 息 检 索 和 自然 语言 处 理 等 
领域 得 到 了 成 功 应 用 。 意 见 挖掘 和 情感 分 析 为 处 
理 非 结 构 化 数据 提供 了 一 种 计算 式 的 方法 ,主要 用 来 
实现 意见 的 提炼 和 情感 的 识别 。 

主流 的 情感 分 析 方 法 可 以 分 为 基于 词典 的 分 析 方 
法 和 基于 机 器 学 习 的 分 析 方 法 ,本 文选 择 基 于 词典 的 


馆 资 源 的 理性 评价 和 情感 倾向 。 


3 ”数据 预 处 理 


3.1 评价 效果 分 析 过 程 
本 文 以 移动 图 书馆 UCC 为 研究 对 象 ,通过 对 所 获 
取 的 UGC 进行 情感 分 析 , 获取 其 中 的 积极 情感 .中 性 
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情感 和 消极 情感 。 作 为 评价 模型 的 输入 数据 ,再 通过 
评价 模型 的 输出 (预测 ) 数 据 和 实际 数据 的 比较 ,检验 
UGC 中 的 情感 倾向 对 用 户 实际 评价 情况 的 影响 效果 。 
根据 上 文 的 论述 ,本 文 提 出 了 基于 情感 分 析 的 移动 图 


书馆 UGC 评价 效果 分 析 过 程 ,在 数据 获取 和 数据 清洗 
的 基础 上 ,分 析 过 程 主要 包括 领域 词典 构建 ,分 词 及 情 
感 分 类 和 评价 效果 分 析 3 个 阶段 。 如 图 1 所 示 : 


分 词 及 情感 分 类 评价 效果 分 析 


领域 情感 
词典 


模型 训练 


jin m 


1 
| 
k » 
E: 


图 1 移动 图 书馆 UGC 评价 效果 分 析 过 程 


™ 
uc 研究 样本 选择 


(O 〇 移动 图 书馆 能 够 吸引 较 多 读者 阅读 并 进行 评论 ， 
iini) qU'UEM Eg UCC 具有 样本 


DEDIRE. EAREN 2017 年 各 大 畅销 书 榜 单 
的 综合 调查 ,结合 实际 获取 数据 的 可 能 性 ,选择 了 15 
部 年 度 畅销 书籍 ,利用 网 络 疏 虫 Gooseeker 对 “ 掌 阅 图 
dig" eara 15 部 书籍 的 用 户 评论 进行 抓 取 。 由 
ER 同 书籍 的 评论 量 相差 较 多 ,为 使 数据 具有 可 比 性 ， 
设 定 抓 取 每 部 书籍 用 户 评论 的 前 20 页 数据 。 抓 取 目 
标 之 籍 名 称 及 其 用 户 综合 评分 如 表 LB 

>< El 目标 书籍 名 称 及 评分 


c 书籍 名 称 1P EA 书籍 名 称 用 户 评分 
p= 说 9.1 看 见 9.2 
Y = i 
O 摆渡 人 8.9 罗 辑 思维 9.2 
大 秦 帝 国 8.9 人 类 简 史 9.1 
岛 上 书店 9.3 我 懂 你 的 知识 焦虑 8.6 
HEGAGS 8.7 RIH 9.0 
好 好 说 话 : 新 鲜 有 趣 的 话 术 精进 技巧 ”8.7 MET 9.1 
解忧 杂货 店 9.7 追 风 筝 的 人 9.2 
巨人 的 陨落 8.6 
注 : 用 户 评分 满分 为 10 分 
d 1 中 的 用 户 评分 是 目标 移动 图 书馆 根据 用 户 对 


书籍 的 实际 打分 所 计算 出 的 平均 得 分 ,反映 了 用 户 对 
书籍 的 支持 程度 ,评分 越 接近 10 分 则 表示 该 书籍 越 受 
到 用 户 的 认可 。 由 于 所 选择 的 目标 书籍 是 2017 年 度 
畅销 书 ,因此 得 分 情况 普遍 俩 高 。 但 是 评分 仅 能 看 出 
用 户 对 书籍 的 整体 评价 情况 ,不 能 对 用 户 的 个 人 阅读 
感受 做 出 详细 了 解 ,因此 需要 进一步 挖掘 UGC 中 隐 含 
的 用 户 情感 倾向 。 
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3.3 数据 清洗 
将 抓 取 到 的 评论 文本 数据 分 别 存 为 TXT 格式 , 利 
R 语言 中 的 gsub 函数 对 原始 数据 中 可 能 对 下 一 步 
ne qudd) 符号 、 空 格 等 进行 清 
洗 ,经 过 处 理 后 的 数据 如 图 2 所 示 。 经 过 清洗 的 数据 
除去 了 会 影响 数据 处 理 的 符号 和 字符 ,避免 了 数据 读 
取 不 完整 的 可 能 性 ,可 以 进行 下 一 步 的 分 词 处 理 。 


父母 言传 身 教 ， 现 在 一 说 知识 分 子 很 多 人 都 会 嘲笑 ， 每 天 拿 着 手机 玩 着 游戏 刷 着 朋友 圈 播 着 直播 1 
其 乐 融融 的 一 家 真是 FERAE SEE REPRE IN ARAR Hr LE ALTE o 执 子 之 手 与 了 借 老 真是 ; 


BERN JE ， 一 些小 动作 ， 都 可 以 感受 到 “我 们 仁 ” 的 感情 无 比 亲 近 。 想 
T 

EORNM EA 彼此 辛 挂 ， 虽 不 舍 杨 绛 的 高 开 ， TL Lm 

很 感动 的 就 是 最 后 白 发 人 送 黑 发 人 的 时 候 比较 难过 ， 唯 一 的 女儿 不 能 给 自己 尖 终 了 是 多 大 | 
pat ahe 终于 团聚 了 


生活 日 常 ， 写 的 插 好 的 ， 执 子 之 手 与 子 代 老 ， 记录 着 老 一 辈 人 的 婚姻 观 ， 人 生 观 ， 
RUREBAAT, 民国 期 间 那么 多 的 爱恋 ， 他 们 的 爱情 平实 浓厚 ， 温 暖 值得 回味 
很 好 玩 读 必 了 
一 生 有 如 此 家 人 相伴 足 笑 。 临 难 心 犹 暖 。 有 多 少 人 一 生 能 如 此 相伴 。 人 生 的 哲学 
"m PORPRA Ah 心 刷 没 了 ! 总 之 ,极力 推荐 给 大 家 ， 从 平淡 朴实 的 语言 和 报 述 中 去 1 


Ee Pia- 看 

Tù, 至 情 至 性 。 做 学 问 ， 还 是 日 常 ， 都 是 平凡 、 单 纯 的 坚守 ， 细 腊 至 极 。 钱 先生 ， 杨 先生 
RATER 周年 纪念 日 的 日 子 里 《我 们 仁 疼 在 掌 阅 上 线 了 。 女 儿 丈 夫 相 继 离 去 ， 只 剩 下 杨 先 : 
非常 感人 , 一 家 人 这 么 有 才华 ， 却 遇 到 了 那样 的 时 期 ,但 是 也 很 羔 慕 一 家 人 的 相爱 ,就 是 到 最 后 , 


本 书 的 名 党 就 是 平淡 相 素 ， 正如 原文 所 说 “我 们 这 个 家 , 很 朴素 ; 我 们 仁 个 人 ， 很 单纯 。” 
snc 在 家 的 关系 不 单单 是 父母 与 子女 ， 有 时 像 朋友 ， 有 时 像 哥 们 ， ABENE NEAR 
个 人 觉得 很 没有 共鸣 , 除了 对 于 人 生 的 感情 有些 异 懂 ， 其 他 的 父子 ， 母子 关系 无 感 


图 2 评论 内 容 处 理 截 图 ( 部 分 ) 


4.1 领域 情感 词典 构建 

移动 图 书馆 UGC 中 的 情感 倾向 绝 大 多 数 是 通过 
情感 词 表现 的 ,情感 词典 是 否 具有 较为 全 面 的 覆盖 性 ， 
在 一 定 程度 上 影响 着 情感 分 类 效果 。 目 前 较为 成 熟 的 
基础 汉语 情感 词典 有 很 多 , 比如 知 网 (Hownet ) 情感 词 
典 、 台 湾 大 学 简体 中 文 情 感 极 性 词典 (NTSUSD ) 等 ,但 
是 仅仅 依靠 基础 情感 词典 来 识别 文本 句子 中 的 情感 词 
是 不 够 的 ,在 特定 的 领域 ,有 些 并 没有 归 人 基础 情感 词 
的 词汇 也 具有 情感 倾向 ,因此 构建 领域 情感 词典 是 十 
分 必要 的 ,也 是 情感 分 析 的 基础 。 


i — SA i ChjnaXiy 合 作 期 于 
EmA, PURGE, PIE, 等 . 基于 情感 分 析 的 移动 图 书馆 用 户 生成 内 容 评价 效果 研究 [J]. 图 书 情报 二 从 ,20T8 ,65 C18 
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4.1.1. 基础 情感 词典 ”本文 以 知 网 (Hownet ) 情 感 词 

典 为 基础 ,并 将 其 中 不 常用 的 词语 进行 删除 ,同时 还 根 

据 移动 图 书馆 UGC 领域 的 特点 对 部 分 情感 词 的 倾向 

进行 修正 ,最 终 得 到 基础 情感 词典 组 成 如 表 2 所 示 : 
表 2 基础 情感 词典 


词语 集 名 称 权 值 词语 数量 (个 ) 
积极 情感 词 1 3 779 
消极 情感 词 -1 3 330 


4.1.2. 领域 情感 词典 在 领域 情感 词典 构建 方面 ,本 
文选 择 使 用 点 互信 息 (pointwise mutual information , 
PMI) 来 提炼 领域 情感 词 。PMI 在 自然 语言 处 理 方 面 可 
以 用 来 统计 两 个 词语 x 和 y 之 间 的 相似 性 ,其 基本 思 
想 是 如 果 x 和 y 在 文本 中 同时 出 现 的 概率 越 大 , 则 两 
者 的 相关 性 越 高 ,情感 倾向 一 致 ,计算 公式 如 下 : 
PMI(x;y) =log[ p(x,y)/p(x)p(y)] =log[p(xl 
(x)] 式 (1) 
公式 (1) 中 p(x,y) 表 示 x 和 y 同 时 出 现 的 概率 ,p 
SAI p(y) 表 示 x 和 yy 单独 出 现 的 概率 。 在 本 章 的 数 
据 角 ,两 个 词语 同时 出 现 的 概率 以 及 单个 词语 出 现 的 
概 楷 都 可 以 通过 对 语 料 集 的 统计 得 到 。 设 N 为 语料库 
FER] C, dx 和 dy 分 别 是 两 个 词 在 评论 语料库 中 出 现 
的 全数 ,dxy 是 两 个 词 在 语料库 中 同时 出 现 的 次 数 , 则 
PM y 的 公式 可 以 写 为 ; 
:= PMI(x;y) = log[ N * dxy/dxdy | 式 (2) 
通过 计算 PMI (x;y) 的 值 , 最 终 根据 值 所 属 的 范 
下 和 定 x 和 7y 之 间 的 关联 度 , 确 定 的 规则 如 表 3 所 


MJ X3 PMI 关联 度 
PMI(x;y) >0 两 个 词语 是 相关 的 
=0 两 个 词语 是 相互 独立 的 , 既 不 相关 也 不 互 斥 
«0 两 个 词语 是 互 斥 的 


本 文 将 PMI 引入 到 情感 分 析 领 域 来 计算 词语 的 情 
感 倾向 ,从 而 确定 领域 情感 词 。 中 选取 基准 词 集 ,包含 
一 组 积极 情感 基准 词 Pwords 和 一 组 消极 情感 基准 词 
Nwords;@) 分 别 计算 某 词 语 x 与 Pwords 和 Nwords 的 
PMI;(3) 将 该 词语 的 两 个 PMI 做 差 ,根据 差 值 确定 其 情 
感 倾向 ,遵循 如 表 4 所 示 规 则 : 
表 4 PMI 词语 情感 倾向 标准 


PMI( Pwords;x) - PMI( Nwords ;x ) >0 ”积极 情感 词 
=0 中 性 词 


«o ”消极 情感 词 


通过 人 工 挑选 出 情感 倾向 明显 的 积极 情感 词 20 


个 和 消极 情感 词 20 个 ,使 用 领域 情感 词 识 别 方法 构建 
领域 情感 词典 。 将 提炼 出 的 候选 词 与 基础 情感 词典 进 
行 查 重 对 比 , 最 终 获 得 积极 情感 词 160 个 ,消极 情感 词 
49 个 。 将 其 加 入 基础 情感 词典 ,共同 构成 本 研究 的 移 
动 图 书馆 UGC 领域 情感 词典 。 

4.1.3 和 否定 词 的 分 析 否定 词 是 表示 和 否定 意义 的 词 
语 ,分 析 表 明 ,被 否定 词 修饰 的 情感 词 的 情感 极 性 一 般 
会 发 生 改 变 。 当 一 个 否定 词 修饰 一 个 积极 情感 词 , 则 
原本 表达 的 积极 情感 就 会 转变 为 消极 情感 ,反之 亦 然 。 
在 实际 算法 中 , 当 情 感 词 前 有 否定 词 时 ,将 情感 词 权 值 
乘 以 -1。 常 见 的 否定 词 如 表 5 所 示 : 

R5 常见 否定 词 


数量 (个 ) ” 权 值 否定 词 (列举 ) 
62 -l 看、 别 . 并 非 、 并 未 、 不 .不 必 .\ 不 曾 非 . 否 、 弗 、 毫 不 、 毫 


无 .很 少 . 极 少 、 几 乎 不 …… 


4.1.4 程度 副词 的 分 析 程度 副词 一 般 用 于 修饰 或 
者 限制 动词 或 形容 词 , 用 以 表示 范围 或 者 程度 。 由 于 
移动 图 书馆 UGC 的 篇 幅 普遍 俩 小 ,因此 程度 副词 的 应 
用 对 用 户 情 感 的 表现 具有 重要 作用 ,可 以 使 原 有 语句 
在 情感 程度 上 产生 较 大 强 弱 变化 。 因 此 ,本 文 依据 中 
知 网 提供 的 “中 文 程度 级 别 词语 ”构建 一 个 程度 副 
词 表 ,并 根据 程度 副词 的 情感 倾向 强 弱 程 度 设置 相应 
的 权 值 ,如 表 6 所 示 : 
表 6 程度 副词 


Bi 


等 级 BE 程度 副词 (列举 ) 
“极其 /最 ” 2 非常 . 极 .极度 ,极端 .极其 .极为 69 
“很 ” 1.75 不 少 . 出 奇 .大 为 .分 外 ,格外 、 颇 为 . 太 、 42 
特别 .着实 
“ 较 ” 1.25 ”更 .更 加 、 更 进一步 .更 为 .还 .还 要 、 较 、 37 


较 比 、 较 为 .进一步 
“ 稍 ” 0.5 ”或 多 或 少 . 略 . 略 加 \ 略 略 ` 略 微 . 略 为 、 29 
稍 、 稍 稍 、 稍 微 .稍为 、 稍 许 


4.2 情感 分 类 

本 文 对 每 本 书籍 用 户 评论 清洗 后 单独 建立 文件 ， 
针对 每 一 个 文件 ,首先 对 单条 用 户 评论 进行 文本 预 处 
理 , 并 以 标点 符号 为 分 割 标 志 , 将 单条 用 户 评 论 分 割 为 
n 个 句子 (只 有 一 句 话 的 评论 不 进行 分 割 ) ,提取 每 个 
句子 中 的 情感 词 ;在 构建 好 的 领域 情感 词典 中 寻找 匹 
配 情感 词 ,并 以 匹配 到 的 每 个 情感 词 为 基准 ,向 前 依次 
寻找 程度 副词 以 及 否定 词 ,并 作 相 应 分 值 计算 ;对 分 句 
中 每 个 情感 词 的 得 分 做 求 和 运算 ,最 后 对 该 条 用 户 评 
论 的 所 有 分 句 的 分 值 进 行 累加 ,获得 该 条 用 户 评论 的 
最 终 得 分 。 
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图 二 情报 三 作 


第 62 卷 第 18 期 2018 年 9 月 


ChinaXiv 合 作 期 刊 


4.2.1 分词 及 句子 切 分 
(1) 调 用 Python 中 的 jieba 分 词 , 并 读 取 已 经 构建 
好 的 领域 情感 词典 和 停 用 词 词典 ,对 移动 图 书馆 UCC 


单个 文件 进行 分 词 和 去 除 停 用 词 ; 
(2) 对 切 分 出 的 情感 词 进行 情感 词性 标注 ,使 词 
和 词性 构成 一 个 元 组 ; 


(3) 根 据 文本 中 的 标点 符号 进行 句子 切 分 。 
4.2.2 ”情感 打分 在 上 一 步 处 理 的 基础 之 上 ,对 已 经 
切 分 好 的 语句 进行 情感 打分 : 

(1) 读 取 领 域 情 感 词典 、 否 定 词 表 ,程度 副词 表 ; 

《2) 根 据 和 否定 词 、 程 度 副词 的 种 类 不 同 乘 以 不 同 
的 权 值 , 设 w; 是 匹配 到 的 某 个 情感 词 ,其 情感 倾向 O; 
的 计算 公式 为 : 


0, = Aw, * Vw; RG) 
DARCO) P Ae, Iw, IBERIA e, E v, 
HEME ; 
m 出 现 否 定 词 时 ,0, 的 计算 公式 为 : 
© 0, = Nw, * Vw, 
OO 其 中 Nu, 是 w 的 否定 词 的 权 值 。 
中 因此 ,每 个 语句 的 情感 倾向 0; 的 计算 公式 为 : 
E Os = 20i 式 (5) 
忠 则 每 一 个 被 切 分 成 个 语句 的 用 户 评论 的 最 终 情 
感 幢 向 得 分 0 为 : 
2 


式 (4) 


Ds D 式 (6) 
PKO ARENS DIEDER rM i LM 
向 得 分 时 采取 四 舍 五 人 取 整 数 的 做 法 以 增强 情感 

得 分 的 直观 性。 

CO 通过 以 上 步骤 对 15 部 书籍 的 用 户 评论 内 容 进 行 
情感 倾向 计算 ,所 得 到 的 逐条 评论 的 情感 倾向 打分 结 
果 如 图 3 所 示 ; 


感觉 是 故事 的 拼凑 ， 格 局 太 小 ! 还 是 说 我 看 不 懂 ? 
那个 解忧 杂货 店 和 孤儿 院 ， 注定 一 辈子 存在 一 定 的 关系 。 就 因为 他 们 的 创始 人 或 者 
蛮 好 的 啊 ， 这 是 一 个 相互 救赎 的 故事 ,不 管 你 的 过 去 如 何 ， 只 有 你 心中 还 存 有 善 念 ， 
LEER anan 结合 ， 浑 然 一 体 
环 相 扣 因果 循环 很 不 错 
ST. DECR RN 本 书 好 书 而 感到 幸运 
RINE, 听 说 凯 凯 要 注 这 本 书 ,就 来 看 ,结果 看 入 迷 了 ， 不 说 了 ,被 细 粉 了 

后 感觉 总 体 的 构思 还 是 拌 不 错 的 ， 条 和 有 全线 直人 种 故事 ， 总 体 来 说 也 是 
BUS EROR, 我 就 看 了 ， 没 想到 如 此 好 看 ， 我 花 了 三 i E 创 历史 新 下 
每 一 个 故事 都 是 独立 的 ， 同 时 每 一 个 都 值得 深思 值得 一 遍 遍 的 阅 
觉得 这 本 书 不 能 更 好 ， 想 把 我 所 有 的 泣 美 之 词 都 写 出 来 ， RERERSXÍ P3808 7 
EE, MEME, ERRE, MAENE, ESSI. 
非常 棒 的 一 本 书 ， 内 容 紧凑 ， 条 理 清晰 ZARE, RETARD, 2AA 
教 人 向 善 ， 故 事 构思 精妙 ,佩服 作者 的 想象 力 ， biarn 的 穿越 不 同 ， 以 前 看 的 穿越 
一 夜 无 眠 ， 一 夜 看 到 现在 ， 终 于 看 完了 。 不 林 感 慨 ， 作 者 的 写作 之 扣 人 心 该 ， 强 大 和 
之 前 一 直 知道 这 本 书 ， 但 是 昨天 才 开始 看 《因为 很 无 聊 ) ， 结 果 一 开始 就 停 不 下 来 . 
看 完 ， 内 容 很 精彩 。 看 完 感 觉 心 情 有 点 莫名 的 沉重 说 不 出 来 。 
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图 3 情感 倾向 得 分 结果 (节选 ) 


通过 对 每 一 部 书籍 的 用 户 评论 情感 倾向 进行 统 
计 , 将 情感 倾向 分 为 3 个 层级 , 即 消极 评论 .中 性 评论 
和 积极 评论 ,分 级 依据 如 表 7 所 示 : 
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表 7 情感 倾向 分 级 依据 


层级 分 数 范围 
消极 评论 score <0 
中 性 评论 0 score 1 
积极 评论 score 2 


依据 表 7 分 级 标准 ,15 部 书籍 的 用 户 评论 情感 倾 
向 百分比 的 统计 结果 如 表 8 所 示 : 
表 8 情感 倾向 分 析 结 果 


情感 倾向 层级 (% ) 

书籍 名 称 户 评分 
消极 评论 ”中 性 评论 ”积极 评论 
说 9.1 9.67796 29.677% 60.645% 
摆渡 人 8.9 16.558% 23.094% 60.349% 
大 秦 帝 国 8.9 11.429% 27.619% 60.952% 
岛 上 书店 9.3 6.767% 19.549% 73.684% 
富 爸 爸 穷 爸 爸 8.7 5.556% 29.630% 64.815% 
好 好 说 话 : 新 鲜 有 趣 的 话 术 8.7 12.195% 8.94396 78.862% 

精进 技巧 

解忧 杂货 店 9.7 8.429% 45.977% 45.594% 
巨人 的 陨落 8.6 14.286% 30.519% 51.948% 
看 见 9.2 9.40295 33.333% 57.265% 
罗 辑 思维 9.2 6.040% 24.161% 69.799% 
人 类 简 史 9.1 8.383% 30.539% 61.078% 
我 届 你 的 知识 焦虑 8.6 11.268% 15.493% 73.239% 
RE 9.0 12.549% 11.765% 75.686% 
小 王子 9.1 11.450% 25.191% 63.359% 
追 风筝 的 人 9.2 16.820% 19.266% 63.914% 


4.3 评价 效果 

BP 神经 网 络 是 由 D. E. Rumnelhart 等 “学 者 于 
1986 年 开发 设计 的 人 工 神经 网 络 算法 ,通常 采用 基于 
BP 神经 元 的 多 层 前 向 神经 网 络 结构 ,典型 的 BP 网 络 
结构 是 由 输入 层 .中 间 隐 含 层 和 输出 层 3 个 神经 元 层 
次 构成 的 模型 。 

本 文通 过 情感 分 析 获 得 了 移动 图 书馆 UGC 中 用 
户 情 感 倾 向 数据 ,以 数据 中 的 积极 情感 .中 性 评价 和 消 
极 情感 所 占 百 分 比 作为 BP 神经 网 络 的 输入 数据 ,以 用 
户 对 书籍 的 评分 作为 输出 数据 ,进行 神经 网 络 训练 和 
测试 ,将 书籍 的 实际 得 分 与 神经 网 络 的 预测 得 分 进行 
比较 ,从 而 检验 是 否 可 以 通过 移动 图 书馆 UGC 中 的 用 
户 情感 倾向 评价 书籍 的 受 欢迎 程度 。 

调用 R 语言 的 神经 网 络 程序 包 neuralnet, 输 入 属 
性 为 3 个 ,输出 属性 为 1 个 , 隐 含 层 神 经 元 的 个 数 m = 
Vn+1+a, 其 中 为 输入 层 节点 数 ,1 为 输入 层 节点 
数 ,a 为 1-10 之 间 的 常数 ,经 过 反复 试验 得 到 设置 隐 
含 层 神经 元 为 8 个 时 误差 最 小 ,BP 神经 网 络 的 程序 如 
F: 
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16 -23. 
[1 ]library( grid) 差 , 可 以 看 出 “实际 值 " 与 “预测 值 之 间 的 误差 较 小 。 
[2 ]library( MASS) BP 神经 网 络 通过 对 UGC 中 挖掘 出 的 积极 情感 .中 性 
[3 jlibrary (neuralnet ) 情感 和 消极 情感 3 个 特征 属性 的 学 习 , 成 功 对 书籍 的 


[4]p — matrix ( c (0. 097,0. 297,0. 606,0. 166, 
0.231,0. 603, 0. 114, 0. 276, 0. 610, 0. 068,0. 195, 
0. 737,0. 056, 0. 296,0. 648,0. 122, 0. 089,0. 789, 
0.084,0. 460, 0. 456, 0. 143, 0. 305, 0. 519,0. 094, 
0.333 ,0. 573 ,0. 060 ,0. 242,0. 698) ,10 ,3 ,byrow = T) 

# 输 入 层 为 10 * 3 的 矩阵 ,随机 选择 10 组 数据 为 训 


[5]t — e(9.1,8.9,8.9,9.3,8. 7,8.7,9.7,8.6, 
9.2,9.2) ”# 输 出 层 为 一 个 数值 
[6 ]trainingdata— cbind( p,t) 
Ages d hi 
- [7 ] colnames ( trainingdata) —— c ( " Input] " ," 
hi2" ," InpuG" "Output" )  # 为 矩阵 列 命名 


i 8]net — neuralnet ( Output ~ Inputl + Input2 + In- 


# 合 并 输出 层 与 输 


put, trainingdata, hidden = 8, threshold = 0. 001, learn- 


ingrate = 0. 1, algorithm =" rprop EL , erm. fct 二 
sfeD act. fet = "logistic" ) f£ BP 神经 网 络 


AJO ]print( net) 4 答 出 网 络 计算 过 程 

CO[10]plot(net) # 给 出 网 络 结构 图 形 

S MUT] jesidinse— matrix ( c (0. 084,0. 305,0. 611, 
0.113,0. 155,0. 732,0. 125, 0. 118,0. 757,0. 115, 
062 ,0. 634,0. 168,0. 193 ,0. 639) ,5,3, byrow = T) 

iP ABO EORR 


e 12 ] net. resultsX— compute( net, testdata) # 对 结 


RATI 
[13 ]Is( net. results ) 


#j 反 回 预测 结果 中 的 对 象 名 称 
# 输 出 预测 结 


[14 ] print( net. results $ net. result ) 
有 果 中 的 输出 预测 值 

通过 上 述 程序 的 处 理 ,利用 R 语言 所 构建 的 BP 
神经 网 路 的 预测 结果 如 表 9 所 示 : 

表 9 预测 结果 


实际 值 预测 值 误差 
9.1 9.056 783 248 0. 496 
8.6 8.987 550 379 4.5% 
9.0 8.877 180 627 1.396 
9.1 8.982 631 021 1.296 
9.2 9.225 526 503 0. 396 


RO 中 ,实际 值 "是 5 部 书籍 的 实际 用 户 评分 ， 
“预测 值 " 则 是 BP 神经 网 络 根据 输入 层 的 情感 倾向 数 
据 ,通过 学 习 后 所 做 出 的 预测 结果 ,计算 两 者 间 的 误 


得 分 进行 了 预测 ,预测 结果 与 实际 用 户 评分 误差 较 小 ， 
在 5 部 书籍 的 评分 结果 比较 中 ,最 大 的 预测 误差 仅 为 
4.5% 。BP 神经 网 络 的 构建 较为 合理 , 预测 结果 较为 
准确 。 因 此 可 以 认为 移动 图 书馆 UGC 中 的 用 户 情感 
倾向 可 以 成 为 预测 书籍 受 欢迎 程度 的 依据 。 


5.1 情感 倾向 的 多 元 性 

表 8 中 的 数据 是 对 移动 图 书馆 UGC 中 用 户 情感 
进行 分 类 后 的 统计 结果 。 从 结果 中 可 以 看 出 ,所 有 书 
籍 的 UGC 均 存在 积极 情感 .消极 情感 和 中 性 评价 3 个 
方面 ,即便 是 用 户 评分 较 高 的 《解忧 杂货 店 兴 岛 上 书 
店 》 和 《 追 风筝 的 人 》 等 书籍 ,也 存在 一 定 " 消 极 情感 ” 
的 用 户 评论 。 从 这 一 点 可 以 看 出 ,用 户 的 偏好 是 多 元 
化 的 ,用 户 对 移动 图 书馆 的 信息 资源 存在 着 个 性 化 的 
需求 和 观点 。 移 动 图 书馆 UGC 服务 鼓励 用 户 成 为 移 
动 图 书馆 的 内 容 贡献 者 ,通过 UGC 的 产生 共享 和 传 
播 , 用 户 可 以 自由 地 发 表 个 人 观点 和 评论 ,实现 与 其 他 
和 户 之 间 的 互动 交流 ,将 个 人 的 主张 和 看 法 融 人 移动 
图 书馆 系统 整体 。 从 这 一 点 来 看 ,移动 图 书馆 UGC 服 
务 是 一 个 强调 包容 性 .个 性 化 和 多 元 化 的 服务 模式 ,多 
许 不 同 的 声音 和 观点 融合 交流 ,共同 推动 移动 图 书馆 
服务 的 发 展 和 完善 。 
5.2 情感 倾向 的 一 致 性 

从 表 8 统计 结果 中 可 以 看 出 ,用 户 评分 较 高 的 书 
籍 的 UGC 中 积极 情感 和 中 性 情感 所 占 的 比例 较 大 。 
由 于 用 户 情 感 倾 向 的 表述 是 十 分 复杂 的 ,因此 基于 词 
典 的 分 析 方 式 会 造成 一 定 的 分 类 误差 ,因此 表 8 中 的 
全 部 数据 存在 一 定 程度 的 不 一 致 性 。 但 是 从 数据 的 对 
比 结果 可 以 认为 ,用 户 的 情感 倾向 能 够 较为 准确 地 反 
映 用 户 对 移动 图 书馆 信息 资源 的 好 恶 程度 ,用 户 通 过 
积极 贡献 内 容 的 方式 不 仅 表达 了 自身 对 于 所 阅读 内 容 
的 见解 和 观点 ,也 展现 了 对 于 移动 图 书馆 UGC 服务 的 
接受 程度 ,移动 图 书馆 可 以 根据 UGC 中 所 蕴含 的 用 户 
情感 倾向 ,及 时 了 解 用 户 对 于 信息 资源 的 需求 和 偏好 ， 
并 且 对 服务 中 所 存在 的 问题 进行 及 时 沟通 和 解决 。 因 
此 ,移动 图 书馆 UGC 可 以 作为 判断 移动 图 书馆 服务 效 
果 的 评价 依据 。 
5.3 ”中 性 评价 的 重要 性 

从 表 8 中 还 可 以 看 出 ,UGC 中 的 中 性 评价 对 于 用 
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户 评分 的 高 低 具有 较 大 影响 作用 。 在 用 户 评分 较 高 的 
几 部 书籍 中 ,如 《解忧 杂货 店 兴 看 见 % 巨 人 的 陨落 》 中 
的 UGC ,中 性 评论 所 占 比例 达到 了 30% 或 者 更 大 。 在 
对 打分 后 的 用 户 评论 进行 统计 的 过 程 中 ,笔者 发 现 得 
分 在 1 - 2 分 之 间 的 中 性 评论 多 是 关于 作者 描写 手法 、 
写作 思路 和 整体 构架 等 方面 的 较为 理性 ,不 带 有 强烈 
感情 色彩 的 内 容 , 因 此 中 性 评论 的 UGC 内 容 多 是 关于 
用 户 对 于 书籍 的 理性 评述 ,具有 较 高 的 用 户 知识 凝结 
性 ,对 其 他 用 户 能 够 起 到 帮助 了 解 书 籍 内 容 ,提高 书籍 
赏 水 平 的 作用 。 因 此 ,中 性 评论 所 占 比例 较 高 的 书 
籍 ,用 户 评分 也 相应 较 高 。 从 这 一 点 可 以 看 出 ,UGC 作 
为 移动 图 书馆 用 户 集体 智慧 的 表现 ,对 其 所 蕴含 的 知 
识 进行 分 享 是 移动 图 书馆 用 户 进行 互动 交流 的 重要 动 
加 用 户 不 仅 看 重 通 过 UCC 表达 自己 对 移动 图 书馆 信 
自 资 源 的 好 恶 程度 ,也 看 中 如 何 通过 其 他 人 所 提供 的 
“于 货 "学 习 到 有 用 的 知识 。 
) 评价 效果 的 合理 性 
全 在 数据 处 理 的 第 二 阶段 ,本 文通 过 构建 BP 神经 网 


络 x 实 现 了 对 移动 图 书馆 UGC 评价 效果 的 预测 分 析 ， 
BE 种 经 网 络 通过 对 输入 特征 属性 的 学 习 , 成 功 实现 了 
对 3 部 书籍 的 评分 预测 , 且 得 出 了 较为 准确 的 结果 ,证 
明 移 动 图 书馆 UGC 中 的 用 户 情感 倾向 代表 了 用 户 对 
因 虽 馆 资源 的 评价 态度 。 移 动 图 书馆 社 群 化 服务 的 过 
程 类 是 用 户 与 其 他 用 户 、 用 户 与 服务 平台 之 间 进 行 信 
放流 和 互动 的 过 程 ,体现 了 用 户 集体 智慧 和 价值 创 
iJ. UCC 作为 最 具 代 表 性 的 集体 智慧 价值 的 体现 ， 
不 权 是 移动 图 书馆 UGC 服务 所 产生 的 重要 信息 资源 ， 
也 晤 用 于 评价 其 服务 效果 的 可 靠 数据 。UGC 中 所 包含 
的 移动 图 书馆 服务 资源 的 评价 内 容 和 情感 倾向 等 ,不 
仅 能 够 对 其 他 用 户 产生 重要 的 导向 作用 ,还 可 以 成 为 
移动 图 书馆 完善 其 服务 措施 ,提高 其 服务 质量 的 参考 


E 
意见 。 


6 研究 结论 


本 研究 的 目的 是 通过 对 移动 图 书馆 用 户 生成 内 容 
(UGC) 的 情感 分 析 , 预 测 用 户 情感 倾向 对 移动 图 书馆 
资源 的 评价 效果 。 基 于 情感 分 析 方 法 ,提出 移动 图 书 
tit UGC 评价 效果 分 析 过 程 ,从 领域 情感 词典 构建 、 情 
感 分 类 和 评价 效果 3 个 方面 进行 验证 分 析 。 数 据 结果 
表明 ,移动 图 书馆 UCC 中 用 户 情感 倾向 具有 多 元 性 和 
一 致 性 ,并 且 中 性 评论 具有 重要 作用 。 移 动 图 书馆 
UGC 中 的 用 户 情感 倾向 代表 了 用 户 对 图 书馆 资源 的 
评价 态度 ,及 时 掌握 UCC 中 的 用 户 情感 趋势 ,有 助 于 
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图 书馆 及 时 了 解 用 户 对 馆藏 资源 的 认可 程度 ,及 时 调 
整 其 服务 策略 。 

本 文 的 主要 局 限 性 在 于 基于 词典 的 情感 分 类 比较 
依赖 于 词典 的 全 面 性 。 在 后 续 研 究 中 ,将 进一步 完善 
领域 情感 词典 ,从 而 使 其 覆盖 性 进一步 提高 。 
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Abstract. [ Purpose/significance | This study aims to make an analysis of the evaluation effect of the mobile library 


user-generated content ( UGC), which is beneficial to improve the recommendation and promotion of mobile library re- 


soüfces. | Method/process] An evaluation model is constructed based on the sentimental analysis. After the preprocess- 


ing^of the UGC of the 16 best-selling books from Zhangyue library, data analysis is divided into three stages, including 


digtienary construction, sentiment classification and evaluation. | Result/conclusion | The results show that the sentimen- 


tal-tendencies of UGC in mobile libraries are pluralistic and consistent, and the neutral evaluation is important, as well as 


thé final evaluation results is reasonable. In this paper, the theory of sentiment analysis is introduced into the research of 


mobile library UGC, which can provide reference for mobile library to improve its social service measures and improve its 


social service quality. 
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